#!/bin/bash

# 检查是否提供了文件路径作为参数
if [ $# -ne 1 ]; then
    echo "用法: ./url.sh <文件路径>"
    exit 1
fi

# 获取文件路径
file_path=$1

# 检查文件是否存在
if [[ ! -f "$file_path" ]]; then
    echo "文件不存在，请检查路径。"
    exit 1
fi

# 创建一个临时文件用于存储主域名
temp_file=$(mktemp)

# 处理文件，提取主域名并存储
while read -r url; do
    # 提取主域名
    domain=$(echo "$url" | sed -E 's#https?://(www\.)?([^/]+).*#\2#')
    echo "$domain" >> "$temp_file"
done < "$file_path"

# 统计每个主域名的出现次数并输出
echo "统计结果："
sort "$temp_file" | uniq -c | sort -nr | while read count domain; do
    echo "$count $domain"
done

# 删除临时文件
rm "$temp_file"
